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元 回归 中 效应 量 的 最 小 个 数 需 求 : 
基于 统计 功效 和 估计 精度 ' 
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(华南 师范 大 学 心理 学 院 , 广州 510631) 


摘 要 元 回归 模型 被 广泛 应 用 于 调节 变量 的 识别 。 从 元 分 析 技 术 的 原理 谈 起 ,介绍 了 元 回归 模型 ， 然 后 采 
用 蒙特 卡 洛 模拟 ， 基 于 统计 功效 和 估计 精度 探究 效应 量 个 数 对 元 回归 模型 参数 估计 的 影响 ， 从 而 确立 效应 量 
的 最 小 个 数 需求 。 主 要 研究 结果 为 : (1) Wald-type z 检验 方法 在 元 回归 中 吻 犯 1 类 错误 ; (2) 为 达到 参数 估计 要 
求 ， 元 回归 至 少 需要 20 个 效应 量 ; (3) 纳 入 合适 的 调节 变量 能 降低 对 效应 量 的 个 数 需 求 。 基 于 研究 结果 ， 提 出 
以 下 建议 : (1) 研 究 者 应 慎重 使 用 Wald-typez 检验 方法 和 CMA 软件 ; (2) 研 究 者 至 少 需要 20 个 效应 量 ， 且 应 当 
根据 实际 情况 进一步 增加 效应 量 个 数 ; (3) 研 究 者 应 当 积 极 探索 合适 的 调节 变量 ; (4) 未 来 审 稿 人 可 参考 最 小 效 
应 量 个 数 需求 对 元 回归 研究 进行 质量 评估 。 

关键 词 ”元 分 析 ; 元 回归 ; 效应 量 ; 最 小 个 数 需求 
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1 3 引言 的 15 年 期 间 , 标题 中 包含 meta-analysis 的 英文 期 
刊 文献 共 11698 篇 ， 其 中 2704 篇 使 用 了 元 回归 模 
传统 的 质 性 文献 综述 往往 存在 “综述 者 偏差 ” TORA 11698 篇 ， 其 中 2704 FBE TEA 
, . b T ok nar 型 。 这 些 文献 的 主题 涵盖 发 展 与 教育 、 行 为 治疗 、 
(Reviewer biases)， 为 了 更 加 科学 、 准 确 地 进行 知 ee feb aa Ae GE SA 
i 加 ar + ll 神经 成 像 、 语 言 认 知 、 管 理 心理 学 等 各 个 心理 学 
识 积累 ,元 分 析 (Meta-analysis) 得 到 了 越 来 越 广 泛 ea hey sean de nk SAD 
的 关注 和 应 用 (Cheung & Vijayakumar, 2016). 3G 领域 。 尽 管 元 分 析 和 元 回归 的 相关 研究 日 益 增 多 
eee OS KOREAR FTCA PTR AY BE UAT A 

分 析 是 基于 量化 统计 方法 的 一 种 系统 性 文献 述评 ie canine eh tas ene 
、 j kerri ah DEAN 地 获得 元 分 析 研 究 结果 等 问题 仍 知之 甚 浅 ,， 因 此 

技术 ， 其 目的 在 于 对 特定 研究 主题 的 不 同 研究 结 四 4 Powe ; 
os 二 = 有 必要 对 其 基本 原理 及 其 应 用 进行 深入 探讨 。 

果 进 行 整 合 和 比较 (Glass, 1976)。 近 年 来 , HAY = : y pao 

= ep ‘ 元 分 析 技 术 的 核心 和 基础 在 于 研究 效应 的 大 
的 元 分 析 发 表 量 增长 迅速 ， 其 中 元 回归 模型 在 调 Se ae Be A 
se ‘ ho, mee 小 ， 即 效应 量 (Effect size, ES)。 效 应 量 描述 了 原始 

节 变 量 的 探索 方面 得 到 了 十 分 广泛 的 应 用 。 通 过 oA aes anes ? : 
= Kets sd es ae 研究 中 变量 之 间 关 系 的 大 小 和 方向 (Coialtay & 
中 国 知 网 检索 发 现 ,从 2004 年 至 2019 年 的 15 年 7 2 es 
ar ae ee eee Wy Karadağ, 2015), 元 分 析 以 原始 研究 所 得 的 效应 量 
期 间 ， 以 元 分 析 为 关键 词 的 人 文 社 科 类 的 中 文 期 A oshete EA EE 
刊 文献 共 862 篇. 其 中 82 篇 使 用 了 元 回归 模型 : 为 样本 ,效应 量 个 数 即 样本 量 。 效 应 量 个 数 的 选 
ae 的 ae i eee 择 是 一 个 成 本 和 效能 的 权衡 过 程 ， 过 少 的 效应 量 
ucation atabdse 、 、 S ` d e TE je, a 
E pe nn me s Fl Researh 可 能 会 遗漏 重要 的 信息 ， 降 低 研究 结果 的 可 信 度 
a ™ ae carer ae es aa fa ae (Cheung & Vijayakumar, 2016)， 然 而 一 味 地 增加 
en nae, Pee = 效应 量 并 不 总 能 提高 统计 功效 ， 还 可 能 导致 参数 
估计 的 波动 (Cohn & Becker, 2003)， 同 时 也 对 研 


baw a: o ee 究 可 行 性 提出 了 较 高 的 要 求 。 

* y 育 质 量 关 键 影响 因素 监测 框架 构建 项 z je aa R 机 = 
Fe aaa aa 纵览 国内 外 已 发 表 的 心理 学 领域 的 元 分 析 研 

通信 作者 : 张 敏 强 , E-mail: 2640726401@qq.com Fe, 实证 研究 者 们 纳入 的 效应 量 个 数 参差 不 章 ， 
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7820S A (EM, RAS, ZR, FF, 2019), 
多 至 110 个 以 上 (Suchotzki, Verschuere, Bockstaele, 
Ben-Shakhar, & Crombez, 2017; XJR, 48 f& 38, 
2018); 有 学 者 认为 理论 上 来 说 两 个 原始 研究 就 足 
以 开展 元 分 析 研 究 , 但 同时 也 需要 注意 过 少 的 效 
应 量 可 能 会 导致 参数 估计 偏差 和 错误 的 结论 
(Valentine, Pigott, & Rothstein, 2010), Cheung 和 
Vijayakumar (2016) 也 指出 ， 基 于 较 少 效应 量 得 出 
的 综述 性 结论 很 难得 到 认可 ， 如 果 某 个 领域 的 原 
始 研究 或 效应 量 很 少 ， 也 可 能 说 明 该 领域 还 不 够 
RA, 不 足以 支撑 有 意义 的 综述 性 研究 。Viechtbauer, 
Lépez-Lépez, Sinchez-Meca 和 Marin-Martinez (2015) 
的 模拟 研究 结果 表明 , 在 使 用 包含 一 个 调节 变量 
的 简单 元 回归 模型 时 ， 至 少 需要 40 个 效应 量 才能 
保证 一 定 的 统计 功效 ，L6pez-L6pez,，Noortgate, 
Tanner-Smith, Wilson 和 Lipsey (2017) 也 基于 包含 
一 个 调节 变量 的 简单 元 回归 模型 展开 模拟 研究 ， 
结果 发 现 多 数 情 境 下 需要 至 少 80 个 效应 量 。 可 以 
看 出 ,尽管 理论 研究 者 们 对 效应 量 个 数 的 选择 进 
行 了 一 些 探 索 , 但 未 能 得 出 较为 一 致 的 结论 。 

效应 量 个 数 选择 是 元 分 析 领 域 十 分 重要 的 主 
RA, 但 实证 研究 至 今 仍然 缺少 一 个 公认 的 效应 量 
个 数 选择 规范 ， 相 关 模 拟 研究 也 存在 不 足 ， 首 先 
是 未 能 在 具体 的 数量 选择 上 得 出 一 致 的 结论 ， 其 
次 是 目前 仅 针对 包含 一 个 调节 变量 的 简单 元 回归 
模型 展开 讨论 ， 最 后 是 多 数 研究 者 采用 的 效应 量 
Bt tp HELI (4 22 (Viechtbauer et al., 2015; López- 
Lopez et al., 2017), 而 不 是 心理 学 领域 的 元 分 析 
研究 中 更 为 常见 的 探究 变量 间 相 关 程 度 的 效应 量 
(如 Fisher 的 Z), 这 不 利于 为 心理 学 人 研究 者 开展 
元 分 析 实 证 研究 提供 指导 。 

综 上 ,本 文 将 首先 概述 元 分 析 技 术 的 基本 原 
HE, 在 此 基础 上 对 元 回归 模型 进行 介绍 ; 然后 在 
前 人 研究 的 基础 上 对 调节 变量 个 数 进行 拓展 ， 以 
获得 更 符合 实证 研究 需求 的 复杂 元 回归 模型 ， 进 


2 元 分 析 概 述 


21 元 分 析 的 目的 
元 分 析 技 术 的 主要 目的 在 于 : (1) 获 得 普遍 性 
的 研究 效应 大 小 ,计算 总 体 平均 效应 量 ， (2) 揭 示 
不 同 研究 结果 之 间 的 差异 ; (3) 寻 找 调 节 变量 阐明 
人 研究 结果 之 间 差 异 的 来 源 (Field, 2001)。 调 节 变 量 
(Moderator) 指 的 是 对 人 研究 结果 具有 一 定 解释 能 
的 研究 特征 变量 (Cheung & Vijayakumar, 2016; 
Schmidt, 2017). 
2.2 ”元 分 析 模 型 
2.2.1 ”基本 模型 
元 分 析 技 术 有 两 类 基本 模型 : 固定 效应 模型 
(Fixed-effect model) 和 随机 效应 模型 (Random-effects 
model). 
假设 某 一 次 元 分 析 中 纳入 了 个 原始 研究 ， 
得 到 了 个 效应 量 , 则 有 固定 效应 模型 : 
y=0+e(i=1.…h) a) 
其 中 ，y; 表示 第 i PRU WU, A kE 
独立 的 效应 量 ; 0 表示 效应 量 真 值 ; e 表示 第 i 个 
研究 的 抽样 变异 ， 服 从 正 态 分 布 N(0,v;) 。 固 定 效 
应 模型 假设 不 同 研究 结果 之 间 的 变异 全 部 来 源 于 
抽样 误差 .而 这 在 实际 情况 中 往往 不 成 立 ， 因 此 
一 般 不 推荐 使 用 固定 效应 模型 (Huizenga，Visser, 
& Dolan, 2010; Murphy, 2017). 
随机 效应 模型 假设 不 同 研究 结果 之 间 的 变异 
由 两 部 分 构成 : 该 研究 的 效应 量 真 值 与 效应 量 真 
值 总 体 的 均值 之 间 的 变异 以 及 抽样 误差 (Borenstein， 
Hedges, Higgins, & Rothstein, 2009, 2010; Viechtbauer, 
2010)。 公 式 如 下 : 
Vi = fy +u; +e; (i=1--k) (2) 
其 中 ， 羽 表示 效应 量 真 值 总 体 的 均值 ; uw 表示 效 
应 量 真 值 的 变异 ， 即 研究 间 异 质 性 ， 服 从 正 态 分 
N(0,27) o 
这 两 类 基本 模型 的 主要 目的 均 在 于 估计 效应 


而 采用 蒙特 卡 洛 模拟 对 元 回归 模型 的 效应 量 最 小 
个 数 需 求 进行 探讨 。 通 过 操纵 效应 量 个 数 、 调 节 
变量 个 数 、 回 归 系 数 真 值 以 及 研究 间 剩余 异 质 性 
的 不 同 水 平 组 合 设置 多 种 情境 ,并 基于 统计 功效 
和 估计 精度 对 模型 的 参数 估计 表现 进行 评价 ， 红 
在 确立 效应 量 最 小 个 数 需求 , 使 实证 研究 者 能 够 
在 保证 研究 结果 可 靠 度 的 前 提 下 ,尽量 提升 科研 
工作 的 效率 。 


量 真 值 (或 效应 量 真 值 总 体 的 均值 )， 以 获得 一 个 
概括 性 的 结 
2.2.2 ”元 回归 

近年 来 元 分 析 研 究 者 们 的 重点 从 仅仅 关注 效 
应 量 真 值 ( 某 种 效应 是 否 存在 ?) 转 移 到 探索 效应 
量 的 调节 变量 (在 何 种 情境 下 这 种 效应 最 强 ?) 
(Lopez-Lopez et al., 2017; Steel & Kammeyer- 
Mueller, 2002)。 为 此 ,学 者 们 在 元 分 析 基 本 模型 


| 


ChinaXiva ERAT 


第 4 期 TRR 等 : 元 回归 中 效应 量 的 最 小 个 数 需 求 : 基于 统计 功效 和 估计 精度 675 


的 基础 上 发 展 出 了 元 回归 。 

元 回归 (Meta-regression)， 也 称 混 合 效应 元 回 
归 模 型 (Mixed-effects meta-regression model), 其 
通过 寻找 调节 变量 ， 即 研究 特征 变量 (如 被 试 量 、 
被 试 来 源 、 测 量 工具 类 型 、 量 表 长 度 等 ) 来 对 研究 
结果 之 间 的 差异 进行 解释 (Cafri, Kromrey, & 
Brannick, 2010; Card, 2012)。 公 式 如 下 : 

Yi = potpPxnt...Poxip tu; +e; (i=1k) (3) 
元 回归 可 以 看 作 是 元 分 析 与 回归 分 析 的 结合 ， 
中 ,效应 量 观测 值 y 作为 因 变 量 ,调节 变量 
Xa Xip 作为 自 变 量 (Viechtbauer et al., 2015), £ 
表示 模型 截 距 ，x, 表示 第 i 个 研究 中 第 p 个 调节 
变量 的 值 ，p, 表示 第 p 个 调节 变量 的 回归 系数 ; 
u; 表示 纳入 调节 变量 后 的 剩余 研究 间 变 异 ， 服从 
E 态 分 布 N(0,7?) o 

元 回归 是 公认 的 识别 调节 变量 最 合适 的 方法 
(López-López et al., 2017; KRS, KYL, 钟 文 
昭 ，2009)， 其 既 可 以 处 理 类 别 型 调节 变量 也 可 以 
处 理 连续 型 调节 变量 , 还 支持 同时 区 分 多 个 可 能 
变量 , 在 国内 外 元 分 析 研 究 中 得 到 了 广泛 应 用 
(Steel & Kammeyer-Mueller, 2002)。 
23 ”元 分 析 计算 原理 
2.3.1 基本 模型 的 计算 原理 : 加 权 求 均值 

元 分 析 基 本 模型 的 使 用 遵循 “3C” 原 理 : 计算 
(Calculate) 每 个 原始 研究 的 效应 量 ,转化 (Convert) 
到 统一 的 度量 下 , 合并 (Combine) 以 获得 一 个 平均 
效应 量 (Field, 2001)。 元 分 析 研 究 者 对 不 同 原始 研 
究 的 关键 结果 信息 进行 转换 ， 得 到 效应 量 ， 然 后 
根据 效应 量 的 准确 性 程度 ， 对 其 赋予 一 定 权 重 ， 
最 后 通过 数学 模型 计算 总 体 平均 效应 的 大 小 ， 获 
得 普遍 性 的 结论 。 
2.3.2 ”元 回归 的 计算 原理 : 估计 和 检验 回归 系数 

元 回归 的 重点 在 于 估计 回归 系数 p, 的 大 小 
并 对 p, 进行 显著 性 检验 。 如 果 检 验 的 结果 显著 ， 
则 可 以 判定 8, 所 对 应 的 调节 变量 xp 是 研究 间 异 
质 性 的 来 源 ; 然后 计算 纳入 x, 前 后 ,模型 中 研究 
间 蜡 质 性 的 变化 比例 ， 就 可 以 得 到 x, 对 研究 
间 异 质 性 的 解释 比例 。 


3 ”模拟 研究 


3.1 ”研究 问题 
纳入 多 少 个 效应 量 是 合适 的 ?这 是 元 回归 ， 
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乃至 元 分 析 的 实证 研究 者 们 都 十 分 关注 的 问题 。 
虽然 有 一 些 研究 进行 了 探讨 ， 但 仍 未 能 在 具体 的 
数量 选择 上 得 出 一 致 的 结论 ， 对 心理 学 元 分 析 实 
证 研究 的 指导 有 限 。 本 研究 拟 解决 以 下 问题 : 第 
一 ,元 回归 模型 达到 一 定 的 参数 估计 要 求 时 效应 
量 的 最 小 个 数 需 求 是 多 少 ? 第 二 ， 当 模型 包含 的 
调节 变量 个 数 不 同 时 , 效应 量 的 最 小 个 数 需 求 是 
否 一 致 ? 第 三 ， 元 回归 模型 对 于 描述 相关 关系 的 
效应 量 的 适应 性 如 何 ? 

3.2 ”研究 设计 

本 研究 将 开展 一 个 蒙特 卡 洛 模拟 研究 , 通过 
效应 量 个 数 、 调 节 变 量 个 数 、 回 归 系 数 真 值 以 及 
研究 间 剩 余 异 质 性 的 不 同 水 平 组 合 设置 不 同情 境 ， 
然后 基于 统计 功效 和 估计 精度 对 不 同情 境 下 元 回 
归 模 型 的 参数 估计 表现 进行 评价 ， 从 而 确立 元 
归 中 效应 量 的 最 小 个 数 需 求 。 

(1) 分 析 模 型 。 选 择 心理 学 元 分 析 研 究 中 最 常 
用 的 元 回归 模型 为 研究 对 象 。 已 有 的 模拟 研究 只 
关注 包含 一 个 调节 变量 的 简单 元 回归 模型 (L6pez- 
Lopez et al., 2017; Steel & Kammeyer-Mueller, 2002; 
Viechtbauer et al., 2015)， 考 虑 到 在 实证 研究 中 往 
往 能 识别 出 两 个 或 两 个 以 上 有 显著 解释 作用 的 调 
节 变 量 , 假设 调节 效应 只 存在 一 个 来 源 是 不 现实 
的 , 因此 有 必要 对 调节 变量 个 数 进行 拓展 。 对 多 
个 调节 变量 组 合 进行 考虑 不 仅 能 够 分 离 不 同调 节 
变量 对 研究 间 异 质 性 的 贡献 ， 而 且 能 较 好 地 避免 
虚假 效应 (Steel & Kammeyer-Mueller, 2002). AS HF 
究 将 分 别 考 虑 包含 一 个 调节 变量 的 简单 模型 和 包 
含 两 个 调节 变量 的 复杂 模型 。 

模型 一 (包含 一 个 调节 变量 ): 

Yi = Po + Bx, +u; +e; G=1---k) 

模型 二 (包含 两 个 调节 变量 ): 

Yi = Bot BX + Pox tu; +e (i=1.k) 

(2) 自 变量 。Q@D 效 应 量 个 数 k: 参考 前 人 研究 
(Lopez-Lopez et al., 2017; Steel & Kammeyer- 
Mueller, 2002; Viechtbauer et al., 2015), 4 k= 20, 
40, 60, 80, 100, 120; 名 回归 系数 真 值 6 ~ b: 模 
型 一 中 令 = 0, 0.2, 0.5， 分 别 代表 零 、 较 小 、 较 大 
的 回归 系数 值 (Viechtbauer et al., 2015); 模型 二 中 
2 By = Py =0, B, =p, =02, 2 = p, =0.5, A =0.2 & 
b =0.5; @ 剩 余 异 质 性 zr?* : 剩余 异 质 性 被 认为 
会 影响 模型 达到 预期 参数 估计 要 求 时 所 需 的 效应 
量 个 数 (L6pez-Lopez et al., 2017; Viechtbauer et al., 
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2015), 参考 前 人 研究 , Sr? = 0.08, 0.32, 分 别 表 
示 较 小 、 较 大 的 剩余 异 质 性 (Viechtbauer et al., 
2015)。 三 种 自 变量 不 同 水 平 的 组 合 能 够 获得 共 
6 x (3 +4) x 2 = 84 种 不 同 的 模拟 条 件 ; 

(3) 其 他 控制 变量 。Q@D 效 应 量 观测 值 ”和 抽样 
变异 e; : 选取 的 效应 量 形式 是 Fisher 的 Z, Ihi 
述 了 变量 间 的 相关 程度 ,在 心理 学 元 分 析 实 证 研 
究 中 得 到 了 广泛 应 用 。y 的 取 值 通过 上 述 模型 公 
式 得 到 。 抽样 变异 e 随机 生成 自 正 态 分 布 N(0,v)， 


其 中 = +r? (Borenstein et al., 2009), 这 
Nn-3 

里 的 n 指 原始 研究 中 的 样本 量 ， 取 值 随机 生成 自 
对 数 正 态 分 布 LN (0, 0.9), FLA 100， 取 整 后 将 小 
于 25 的 值 转换 为 25， 大 于 1000 的 值 转换 为 1000。 
”为 上 述 自 变量 之 一 ， 取 值 为 0.08 或 0.32; OR 
ARIE By: SA =0; 回调 节 变 量 x : 对 效应 量 
具有 实质 性 调节 作用 的 变量 多 数 是 连续 型 的 
(Borenstein et al., 2009; Steel & Kammeyer-Mueller, 
2002)， 因 此 这 里 调节 变量 均 为 连续 型 变量 ， 取 值 
随机 生成 自 标准 正 态 分 布 。 通 过 对 以 上 变量 的 控 
制 来 生成 不 同形 态 的 数据 集 。 
(4) 结 果 变 量 。 在 不 同 的 模拟 条 件 下 ,利用 元 
相模 型 (模型 一 、 模 型 二 ) 对 数据 集 进 行 估计 ， 获 
回归 系数 的 估计 值 房 、 记 。 每 种 模拟 条 件 重复 
环 10, 000 次 以 获得 较 稳 定 的 参数 佑 计 结 果 。 
(5) 参 数 估计 方法 和 检验 方法 。 参 数 估计 选择 
常用 的 加 权 最 小 二 乘法 ; 参数 显著 性 检验 同时 采 
用 Wald-type z 检验 方法 和 Knapp and Hartung 检 
验方 法 , 前 者 是 元 分 析 实 证 研究 常用 软件 CMA 中 
内 置 的 方法 , 后 者 由 Knapp 和 Hartung (2003) 提 出 ， 
该 方法 被 证 实 适 用 于 多 数 元 分 析 情 境 (Viechtbauer 
et.al., 2015). 

3.3 ”评价 指标 

除了 采用 常用 的 估计 精度 指标 : 参数 估计 偏 
差 和 置信 区 间 宽 度 之 外 ， 本 研究 创新 性 地 将 统计 
功效 确定 样本 量 的 方法 应 用 于 最 小 效应 量 个 数 的 
探索 , 纳入 了 统计 功效 和 工 类 错误 率 作为 评价 指 
标 ， 共 四 类 评价 指标 。 

其 中 ,参数 估计 偏差 的 计算 是 用 回归 系数 的 
估计 值 减 去 真 值 ， 再 将 每 个 模拟 条 件 下 获得 的 
10000 个 差 值 结果 取 均 值 ， 置信 区 间 宽 度 是 用 每 
个 条 件 下 得 到 的 参数 估计 值 所 对 应 的 95% 置 信 区 
间 上 限 减 去 下 限 取 绝对 值 ， 再 将 该 条 件 下 获得 的 


ma ET 


10000 个 结果 取 均 值 ; 当 回归 系数 真 值 不 为 0 时 ， 
每 个 条 件 循环 10000 次 得 到 的 95% 置 信 区 间 中 ， 
不 包含 0 的 次 数 所 占 的 比例 就 是 该 条 件 下 的 统计 
功效 ; 当 回归 系数 真 值 为 0 时 ， 每 个 条 件 循 环 
10000 次 得 到 的 95% 置 信 区 间 中 , 不 包含 0 的 次 数 
所 占 的 比例 ， 即 为 该 条 件 下 的 I 类 错误 率 ( 方 杰 ， 
张 敏 强 , 2012)。 由 于 模型 二 中 待 估计 的 参数 有 两 
个 ,此 时 取 两 种 情况 下 指标 的 均值 作为 每 个 模拟 
条 件 下 的 指标 结 
3.4 “分析 工具 

本 研究 的 数据 生成 和 参数 估计 均 采 用 R 软件 
中 的 metafor 程序 包 (Viechtbauer, 2010)。metafor 
包 操 作 上 简便 易 懂 , 功能 强大 , 不 仅 可 以 同时 对 
多 个 调节 变量 进行 分 析 ， 还 包含 多 种 可 供 选 择 的 
参数 估计 和 检验 方法 ( 董 圣 杰 ， 曾 宪 涛 ， 郭 放 ， 
2012; KBAR, Bee, ICA, RWE, FIIR, 
2015). 


4 结果 与 分 析 


41 ”参数 估计 偏差 

参数 估计 偏差 小 于 0.05 为 宜 (L6pez-Lopez et 
al., 2017; Viechtbauer et al., 2015)。 研 究 结果 表明 ， 
在 所 有 模拟 条 件 下 参数 估计 偏差 均 无 超过 0.05 W, 
说 明 元 回归 模型 总 能 得 到 对 回归 系数 的 无 偏 估计 
这 与 前 人 的 研究 结果 一 致 (L6pez-L6pez et al., 
2017; Viechtbauer et al., 2015). 也 没有 观测 到 调节 
变量 个 数 、 效 应 量 个 数 、 剩 余 异 质 性 大 小 对 参数 
估计 偏差 的 大 小 或 方向 的 明显 影响 趋势 ， 因 此 参 
数 估计 偏差 的 结果 仅 以 附 表 形 式 呈 现 ( 附 表 见 网 


42 置信 区 间 宽 度 
置信 区 间 宽 度 小 于 0.4 为 宜 (L6pez-L6pez et 
al.，2017)。 不 同 模拟 情境 下 的 置信 区 间 宽 度 如 附 
图 1、 附 图 2 所 示 ( 附 图 见 网 络 版 )。 

结果 表明 : 中 在 所 有 模拟 情境 下 ， 置 信 区 间 
宽度 均 随 着 效应 量 个 数 的 增加 而 不 断 变 罕 ， 即 效 
应 量 个 数 的 增加 有 利于 提升 元 回归 的 参数 估计 精 
E, 四 同等 条 件 下 ， 为 达到 预期 参数 估计 精度 ， 
采用 Knapp and Hartung 检验 方法 所 需要 的 最 小 效 
应 量 个 数 总 少 于 Wald-type z 检验 方法 ; 图 在 不 同 
情境 下 模型 要 达到 预期 的 参数 估计 精度 所 需 的 最 
小 效应 量 个 数 不 同 , 详 见 表 1 、 表 2。 
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表 1 参数 估计 精度 在 不 同情 境 下 对 最 小 效应 量 个 数 的 需求 (r? = 0.08) 


t=0.08 
检验 方法 BHO BEDE BODEK 8 一 个 较 大 ,一 个 较 小 
p=0 B=(0, 0) B=02 B=(0.2,0.2) f=05 f=(0.5,0.5) B= (0.2,0.5) 
Knha-test 20 20 20 20 20 20 20 
z-test 23 25 23 25 23 25 25 


注 : 表 中 数据 是 根据 图 中 参考 线 所 对 应 的 效应 量 个 数 临界 值 所 得 ， 下 同 。 


表 2 参数 估计 精度 在 不 同情 境 下 对 最 小 效应 量 个 数 的 需求 (r = 0.32) 


t=0.32 
检验 方法 BAO BEB BEDEK 8 一 个 较 大 ,一 个 较 小 
B=0 B= (0,0) B=02 £=(0.2,0.2) p=0.5 f£=(0.5,0.5) B = (0.2,0.5) 
Knha-test 38 38 38 38 38 38 38 
z-test 43 43 43 43 43 43 43 


4.3 ”统计 功效 


类 错误 率 越 接 近 设 定 值 0.05 越 好 。 不 同 模拟 情 


本 研究 中 的 预期 统计 功效 为 0.8。 不同 模拟 情 境 下 的 I 类 错误 率 如 附 图 5、 附 图 6 所 示 ( 附 图 见 


境 下 的 统计 功效 如 附 图 3、 附 图 4 所 示 ( 附 图 见 网 网 络 版 )。 


络 版 )。 


结果 表明 : 中 不 同情 境 下 ， 统 计 功效 均 随 着 以 改善 Wald-type z 检 验方 法 对 I 类 错误 率 的 控制 ， 


结果 表明 , 纳入 更 多 的 效应 量 一 定 程度 上 可 


效应 量 个 数 的 增加 而 不 断 增 加 直至 稳定 ， 可 以 认 但 仍 明显 低 于 设 定 值 (0.05), 尤其 是 在 剩余 异 质 
ee A i 性 较 小 的 情况 下 ; 而 Knapp and Hartung 检验 方法 


回归 的 统计 功效 。 统 计 功 效 受 到 总 体 效应 大 小 、 在 不 同 条 件 下 的 I 类 错误 率 均 非常 接近 设 定 值 ， 
类 错误 率 和 样本 量 的 影响 ， creer 即 相 比 于 Wald-type z 检验 方法 , Knapp and Hartung 
不 变 时 ， 提 高 其 中 一 个 因素 的 水 平 能 够 促进 统计 检验 方法 对 1 类 错误 率 的 控制 能 力 更 好 ， 这 与 


功效 的 提升 (Valentine et al., 2010), 


在 元 分 析 中 ， ”L6pez-L6pez 等 人 (2017) 的 研究 结果 一 致 。 


效应 量 个 数 相当 于 样本 量 ， 因 此 提高 效应 量 个 数 综 上 , 元 回归 模型 需要 足够 数量 的 效应 量 以 


的 水 平 能 够 促进 统计 功效 的 提升 ; 加 同等 条 件 下 ， 。 达到 参数 估计 要 求 ， 置 信 区 间 宽度 会 随 着 效应 量 
使 用 Knapp and Hartung 检验 方法 时 ， 


期 统计 功效 所 需 的 最 小 效应 量 个 数 一 


模型 达到 预 。 ”个 数 的 增加 而 不 断 变 窄 ， 目 效应 量 个 数 的 增加 有 
般 少 于 Wald- ”利于 提升 元 回归 的 统计 功效 。 将 表 1 至 表 3 进行 


type z 检验 方法 ; @ 在 不 同情 境 下 模型 要 达到 预期 汇总 ， 可 以 得 到 元 回归 模型 对 最 小 效应 量 个 数 的 


统计 功效 所 需 的 最 小 效应 量 个 数 不 | 
44 工 类 错误 率 


本 研究 中 统计 检验 假设 的 显著 性 


司 ， 详 见 表 3。 总 体 需求 ( 见 表 4、 表 5)。 


从 表 4、 表 5 可 以 看 出 ,为 达到 参数 估计 要 求 ， 


水 平 是 0.05， 至 少 需要 纳入 20 个 效应 量 ， 且 应 当 根据 实际 情况 


表 3 统计 功效 在 不 同情 境 下 对 最 小 效应 量 个 数 的 需求 


r= 0.08 r =0.32 
检验 a Veit jy N 8 一 个 较 大 Eis ere 8 一 个 较 大 
方法 BCDE] PEDEK 一 个 较 小 BE) BE) PB( 均 ) 较 大 一 个 较 小 
B=0.2 B=(0.2,0.2) B=0.5 B=(0.5,0.5) B=(0.2,0.5) B=0.2 B=(0.2,0.2) B=0.5 B=(0.5,0.5) £= (0.2, 0.5) 
Knha-test 30 30 vV v 20 70 70 20 20 50 
z-test 38 38 vV V 30 80 80 20 20 52 


TE: vv 表示 该 情况 下 总 能 满足 预期 参数 估计 要 求 ， 如 当 忆 = 0.08, B= 0.5 时 总 能 达到 0.8 的 预期 统计 功效 。 
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表 4 不 同情 境 下 模型 对 最 小 效应 量 个 数 的 总 体 需 求 (Knapp and Hartung 检验 方法 ) 


剩余 异 质 性 较 小 剩余 异 质 性 较 大 
可 归 系 数 取 值 
包含 一 个 调节 变量 包含 两 个 调节 变量 包含 一 个 调节 变量 包含 两 个 调节 变量 
PB( 均 ) 为 0 20 20 38 38 
BES) BEN 30 30 70 70 
BEDEK 20 20 38 38 
By BE Bo BERK 一 一 20 — 50 
表 5 不 同情 境 下 模型 对 最 小 效应 量 个 数 的 总 体 需求 (Wald-typez 检验 方法 ) 
TAZ 剩余 异 质 性 较 小 剩余 异 质 性 较 大 
包含 一 个 调节 变量 包含 两 个 调节 变量 包含 一 个 调节 变量 包含 两 个 调节 变量 
BEDA 0 23 25 43 43 
Bh( 均 ) 较 小 38 38 80 80 
TT BEDEK 23 25 43 43 
> Bi Bis fa BK = 30 =e 52 


一 步 增 加 效应 量 个 数 。 例 如 , 在 采用 Knapp and 无 偏 估计 ， 也 没有 观测 到 其 他 变量 对 参数 估计 偏 
ie eR aE a 差 大 小 或 方向 的 明显 影响 趋势 。 结 果 表 明 元 回归 
目 回 归 系 数 真 值 ( 均 ) 较 小 时 效应 量 需 要 增加 到 至 模型 能 够 较 好 地 适应 心理 学 元 分 析 实 证 研究 中 常 
少 30 个 。 的 Fisher 的 Z, Ane 这 为 元 回归 分 析 在 

总 的 来 看 ， 回 归 系 数 的 真 值 较 小 时 ， 所 需 的 心理 学 领域 的 推广 应 用 提供 了 理论 支撑 。 
效应 量 较 多 。 因 此 , 在 开展 元 回归 研究 之 前 ， 研 究 S.2 ae eee een 
者 可 以 根据 已 有 的 实证 或 理论 研究 对 回归 系数 的 研究 结果 表明 , 元 回归 模型 需要 足够 数量 的 
大 小 范围 进行 预 估 ， 进 而 判断 效应 量 个 数 的 最 低 效应 量 以 达到 参数 估计 要 求 。 有 学 者 指出 ， 过 少 
要 求 ; 此 外 ,同等 条 件 下 ， 剩 余 异 质 性 越 大 ， 所 需 的 效应 量 可 能 会 遗漏 重要 的 信息 ， 降 低 研 究 结果 
的 效应 量 越 多 。 这 反映 了 在 元 回归 研究 过 程 中 探 的 可 信 度 ,得 出 的 综述 性 结论 也 很 难得 到 认可 
索 调节 变量 的 重要 性 ， 因 为 当 纳 入 了 合适 的 调节 变 (Cheung & Vijayakumar 2016), 这 与 本 研究 的 研 
量 时 ， 研 究 间 异 质 性 就 可 以 得 到 有 效 的 解释 ,剩余 究 结果 是 一 致 的 。 为 达到 参数 估计 要 求 ， 研 究 者 
一 异 质 性 就 会 降低 ， 此 时 效应 量 个 数 需 求 也 会 降低 。 至 少 需要 纳入 20 个 效应 量 ， 且 应 当 根据 实际 情况 
l 5 讨论 进一步 增加 效应 量 个 数 。 

同等 条 件 下 ， 剩 余 异 质 性 较 大 、 回 归 系 数 真 

本 研究 基于 心理 学 常用 的 效应 量 Fisher 的 Z, 值 较 小 时 所 需 的 效应 量 较 多 。 因 此 , 研究 者 在 研 
对 元 回归 模型 行 探 索 , 一 方面 验证 了 元 回归 模型 究 开 始 前 应 当 对 回归 系数 的 大 小 范围 进行 预 估 ， 
对 该 效应 量 的 适应 性 ， 另 一 方面 建立 了 元 回归 模 Cn 在 人 研究 
型 中 效应 量 最 小 个 数 需 求 的 规范 ， 进 而 比较 了 最 。 ”过 程 中 则 需要 积极 探索 合适 的 调节 变量 以 降低 简 
小 效应 量 个 数 需 求 在 包含 一 个 、 两 个 调节 变量 的 余 异 质 性 
模型 中 的 差别 ， 以 及 不 同 检 验方 法 对 最 小 效应 量 53 ”调节 变量 个 数 对 效应 量 最 小 个 数 需 求 的 影响 


— 


个 数 需 求 和 模型 参数 估计 的 影响 。 研 究 结果 弥补 在 本 研究 中 ， 最 小 效应 量 个 数 需 求 在 包含 一 
了 现 有 研究 的 不 足 ， 同 时 为 元 回归 在 心理 学 领域 个 、 两 个 调节 变 ee esi 
的 推广 应 用 提供 了 理论 支撑 和 实质 性 的 参考 。 and Hartung 检验 方法 时 , 包含 一 个 、 两 个 调节 变 
5.1 元 回归 模型 对 Fisher 的 Z, 的 适应 性 ai 个 数 


在 本 研究 中 ,元 回归 模型 总 能 得 到 对 参数 的 需求 相同 ; 采用 Wald-type z 检验 方法 时 ， 两 种 元 
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回归 模型 在 不 同情 境 下 的 效应 量 最 小 个 数 需 求 也 
基本 一 致 。 未 来 研究 可 进一步 增加 调节 变量 个 数 ， 
深入 探索 调节 变量 个 数 对 效应 量 最 小 个 数 需求 的 
影响 。 
54 “人 参数 检验 方法 的 比较 

人 研究 结果 表明 ， 同 等 条 件 下 ， 相 比 于 Knapp 
and Hartung 检验 方法 , 使 用 Wald-typez 检 验方 法 
时 ,元 回归 模型 对 I 类 错误 率 的 控制 较 差 .， 且 达到 
预期 统计 功效 和 参数 估计 精度 时 所 需 的 最 小 效应 
量 个 数 一 般 较 多 。 

López-López 等 人 (2017) 对 仅 包 含 一 个 调节 变 
量 的 简单 元 回归 模型 进行 研究 ,结果 表明 了 Wald- 
type z 检验 方法 对 I 类 错误 率 的 控制 能 力 较 差 .本 
研究 通过 拓展 调节 变量 的 个 数 ， 得 到 基于 复杂 元 
回归 模型 的 研究 结果 ,进一步 证 实 了 Wald-type z 
检验 方法 在 控制 I 类 错误 率 方面 的 不 足 。 目 前 国 


调节 变量 的 模型 中 差别 不 大 ; 

(4) Wald-type z 检验 方法 在 元 回归 分 析 中 易 
犯 1 类 错误 。 

6.2 ”建议 

基于 研究 结果 ,下 面 总 结 了 几 点 建议 。 

() 元 回归 模型 可 以 成 为 整合 和 比较 心理 学 领 
域 研究 结果 的 有 效 工 具 ; 

(2) 实 证 研究 者 应 慎重 采用 内 骨 Wald-type z 
检验 方法 的 CMA 软件 ,推荐 使 用 R 软件 的 metafor 
包 及 其 中 的 Knapp and Hartung 检验 方法 ; 

(3) 实 证 研究 至 少 需 要 20 个 效应 量 ， 且 应 当 
根据 实际 情况 进一步 增加 效应 量 个 数 。 在 研究 开 
始 前 ， 研 究 者 应 对 回归 系数 的 大 小 范围 进行 预 估 ， 
在 研究 过 程 中 则 需要 探索 合适 的 调节 变量 以 降低 
剩余 异 质 性 。 采 用 Knapp and Hartung 检验 方法 的 
情况 下 ， 当 剩余 异 质 性 较 小 且 回 归 系 数 ( 均 ) 较 小 


内 心理 学 元 分 析 研 究 者 多 使 用 CMA 软件 ,而 该 
软件 仅 支持 Wald-type z 检验 方法 ， 考 虑 到 Wald- 
type z 检验 方法 犯 1 类 错误 的 概率 往往 偏 大 , 已 发 
表 的 元 分 析 研 究 中 许多 显著 结果 是 有 待 进一步 商 
榨 的 。 未 来 的 元 分 析 人 研究 者 也 应 慎重 使 用 CMA 
软件 。 
55 ”不足 与 展望 

本 研究 仍 存在 一 些 有 竺 改进 的 地 方 。 由 于 目 
前 缺少 对 效应 量 相依 性 (Dependence) 程 度 的 划分 
标准 以 及 公认 的 处 理 方 法 ,本 研究 中 暂 未 讨论 相 


时 需 增 至 30 个 效应 量 ; 当 剩余 异 质 性 较 大 时 , 效 
应 量 增 至 38 个 可 满足 要 求 ， 此 时 若 回归 系数 一 个 
较 大 一 个 较 小 需 增 至 50 个 效应 量 ， 若 回归 系数 
( 均 ) 较 小 需 增 至 70 个 ; 

(4) 这 几 点 建议 可 以 对 未 来 审 稿 人 在 评估 一 个 
元 回归 研究 的 质量 时 提供 参考 有 助 于 考察 该 研 
究 是 否 纳入 了 足够 的 效应 量 个 数 以 获得 稳定 可 信 
的 结果 。 
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What is the minimum number of effect sizes required in meta-regression? 
An estimation based on statistical power and estimation precision 


FANG Junyan; ZHANG Minqiang 
(School of psychology, South China Normal University, Guangzhou 510631, China) 


Abstract: Meta-regression is the most frequently used technique for identifying moderators in 
meta-analysis. In this study, main principles and basic models of meta-analysis and meta-regression were 
briefly introduced first. Then a Monte Carlo simulation was conducted to investigate the minimum number 
of the effect size required in meta-regression based on statistical power and estimation precision. The results 
showed that (1) the Wald-type z test was prone to type I error in meta-regression; (2) at least 20 effect sizes 
were needed to meet parameter estimation requirements; (3) and inclusion of proper moderators could 
reduce the number of effect size required. Therefore, it is suggested that (1) meta-analysts should be careful 
when using the CMA software and the Wald-type z test; (2) at least 20 or more effect sizes are generally 
needed based on different situations; (3) exploration of moderators is necessary; (4) reviewers can value a 
meta-analysis research according to the minimum number of effect size required. 


Key words: meta-analysis; meta-regression; effect size; minimum number requirement 
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附录 1 
参数 估计 偏差 : 
附 表 1 包含 一 个 调节 变量 时 不 同 效应 量 个 数 下 的 参数 估计 偏差 (knha-test) 
t=0.08 r =0.32 
k B=0 B=0.2 B=0.5 B=0 B=0.2 B=0.5 
20 -0.0004 -0.0001 0.0003 -0.0012 0.0008 0.0056 
40 0.0009 0.0004 -0.0001 -0.0031 -0.0011 -0.0009 
60 0.0006 0.0000 -0.0009 0.0010 -0.0014 -0.0009 
80 0.0004 -0.0003 -0.0003 0.0000 0.0003 -0.0005 
100 -0.0007 0.0000 0.0002 -0.0006 0.0004 0.0000 
120 0.0000 0.0000 -0.0004 0.0003 -0.0001 0.0002 
附 表 2 包含 一 个 调节 变量 时 不 同 效应 量 个 数 下 的 参数 估计 偏差 (z-test) 
=0.08 r =0.32 
ý B=0 B=0.2 B=0.5 B=0 B=0.2 B=0.5 
20 0.0000 0.0000 0.0003 0.0026 0.0005 -0.0009 
40 0.0007 0.0004 -0.0009 0.0000 -0.0004 0.0003 
60 -0.0003 0.0007 -0.0001 -0.0005 0.0000 0.0003 
80 0.0000 0.0001 0.0008 0.0001 0.0013 0.0017 
100 -0.0002 0.0001 -0.0001 0.0005 -0.0009 -0.0014 
120 0.0001 0.0003 -0.0006 0.0007 0.0000 0.0002 
附 表 3 包含 两 个 调节 变量 时 不 同 效应 量 个 数 下 的 参数 估计 偏差 (knha-test) 
T =0.08 r =0.32 
B=(0,0) B=(0.2,0.2) B=(0.5,0.5) B=(0.2,0.5) B=(0,0) B=(0.2,0.2) f=(0.5,0.5) $= (0.2, 0.5) 
20  —0.0008 0.0006 —0.0007 0.0003 0.0001  -0.0007 0.0003 —0.0005 
40 0.0003 0.0006 —0.0001 0.0008 —0.0008 0.0001 -0.0017 -0.0005 
60 0.0000 -0.0006 —0.0003 0.0000 0.0004 0.0001 0.0003 -0.0002 
80 0.0001 0.0002 —0.0004 0.0001 0.0005 0.0005 0.0006 0.0001 
100 -0.0002 0.0002 —0.0003 0.0001 0.0004 0.0006 —0.0003 0.0002 
120 0.0000 0.0001 0.0001 —0.0001 —0.0003 0.0000 0.0002 0.0004 
附 表 4 包含 两 个 调节 变量 时 不 同 效应 量 个 数 下 的 参数 估计 偏差 (z-test) 
t=0.08 r =0.32 
B=(0,0) B=(0.2,0.2) B=(0.5,0.5) f=(0.2,0.5) B=(0,0) B=(0.2,0.2) f=(0.5,0.5) £= (0.2, 0.5) 
20 0.0003 —0.0002 0.0009 0.0006 0.0005 -0.0002 0.0000 0.0000 
40 -0.0008 -0.0001 0.0000 -0.0002 0.0002 -0.0002 0.0002 0.0010 
60 0.0001 —0.0002 -0.0004 -0.0001 0.0010 0.0002 0.0005 0.0001 
80 0.0000 —0.0003 —0.0001 0.0002 0.0005 -0.0002 —0.0001 0.0001 
100 0.0001 0.0000 0.0000 0.0000 0.0006 -0.0003 0.0000 0.0002 
120 0.0001 0.0002 0.0005 -0.0001 0.0005 0.0005 0.0000 0.0004 
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附 图 1 包含 一 个 调节 变量 时 不 同 效应 量 个 数 下 的 置信 区 间 宽 度 
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附 图 6 包含 两 个 调节 变量 时 不 同 效应 量 个 数 下 的 工 类 错误 率 


附录 3 


R 语句 

# 以 模型 一 ( 仅 包含 一 个 调节 变量 ) 为 例 # 

install.packages ("metafor") 

library (metafor) 

K<-20 ”# 设 定 效应 量 个 数 K， 有 6 种 取 值 20, 40, 60, 80, 100, 120 
B<-0.0”# 没 定 回 归 系 数 真 值 ， 有 3 种 取 值 0, 0.2, 0.5 

# 需 要 生成 两 个 回归 系数 时 , 添加 下 标 即 可 ,如 B_m<-0, B_n<-0 
tau2<-0.08 ”# 设 定 剩余 异 质 性 ， 有 两 种 取 值 0.08, 0.32 
output<-list(id = NULL, betal = NULL, beta2 = NULL, ci.lb2 = NULL, ci.ub2 = NULL) 
for (i in 1:10000) { 

output$id<-append (output$id, i) 


nn<-rlnorm (K, meanlog = 1, sdlog = 0.9) 

n<- round (nn*K) # 生 成 被 试 量 n 

n[n<25]<-25 

n[n>1000]<-1000 

vv<-1/(n-3) 

vi<-sqrt(vv) 

e<-rnorm (K, mean = 0,sd = sqrt(vv + tau2)) 


xi<-rnorm (K) # 生 成 调节 变量 x 
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yi<-0+xi*ß+e ”# 通 过 元 回归 模型 一 生成 因 变量 y, 其 中 截 距 固定 为 0 

# 拟 合 元 回归 函数 ， 获 得 回归 系数 估计 值 

out<-rma.uni (yi, vi, mods = ~xi, tau2 = tau2, test = "knha", method = "DL") #test 指定 了 检验 方法 
output$betal<-append (output$betal, out$b[1]) 

output$beta2<-append (output$beta2, out$b[2]) 

output$ci.lb2<-append (output$ci.lb2, out$ci.lb[2]) 

output$ci.ub2<-append (output$ci.ub2, out$ci.ub[2]) 

write.table (output, "D:/20-0.0-0.08.txt") 

} 


